home *** CD-ROM | disk | FTP | other *** search
/ Developer CD Series 1999 November: Tool Chest / Dev.CD Nov 99 TC.toast / What's New? / Technical Documentation / Misc Standards / Mac OS Text Encodings / ROMANIAN.TXT < prev    next >
Encoding:
Text File  |  1999-09-24  |  14.1 KB  |  369 lines  |  [TEXT/MPS ]

  1. #=======================================================================
  2. #   FTP file name:  ROMANIAN.TXT
  3. #
  4. #   Contents:       Map (external version) from Mac OS Romanian
  5. #                   character set to Unicode 2.1
  6. #
  7. #   Copyright:      (c) 1995-1999 by Apple Computer, Inc., all rights
  8. #                   reserved.
  9. #
  10. #   Contact:        charsets@apple.com
  11. #
  12. #   Changes:
  13. #
  14. #       b02  1999-Sep-22    Encoding changed for Mac OS 8.5; change
  15. #                           mapping of 0xDB from CURRENCY SIGN to EURO
  16. #                           SIGN. Update contact e-mail address. Matches
  17. #                           internal utom<b2>, ufrm<b2>, and Text
  18. #                           Encoding Converter version 1.5.
  19. #       n05  1998-Feb-05    Minor update to header comments
  20. #       n03  1997-Dec-14    Update to match internal utom<n5>, ufrm<n16>:
  21. #                           Change standard mapping for 0xBD from U+2126
  22. #                           to its canonical decomposition, U+03A9.
  23. #                           Change mapping of 0xAF,0xBF,0xDE,0xDF from
  24. #                           composed S/T WITH CEDILLA to S/T with
  25. #                           COMBINING COMMA BELOW (to match our
  26. #                           decomposition mappings).
  27. #       n02  1995-Apr-15    First version (after fixing some typos).
  28. #                           Matches internal ufrm<n4>.
  29. #
  30. # Standard header:
  31. # ----------------
  32. #
  33. #   Apple, the Apple logo, and Macintosh are trademarks of Apple
  34. #   Computer, Inc., registered in the United States and other countries.
  35. #   Unicode is a trademark of Unicode Inc. For the sake of brevity,
  36. #   throughout this document, "Macintosh" can be used to refer to
  37. #   Macintosh computers and "Unicode" can be used to refer to the
  38. #   Unicode standard.
  39. #
  40. #   Apple makes no warranty or representation, either express or
  41. #   implied, with respect to these tables, their quality, accuracy, or
  42. #   fitness for a particular purpose. In no event will Apple be liable
  43. #   for direct, indirect, special, incidental, or consequential damages 
  44. #   resulting from any defect or inaccuracy in this document or the
  45. #   accompanying tables.
  46. #
  47. #   These mapping tables and character lists are subject to change.
  48. #   The latest tables should be available from the following:
  49. #
  50. #   <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/>
  51. #   <ftp://dev.apple.com/devworld/Technical_Documentation/Misc._Standards/>
  52. #
  53. #   For general information about Mac OS encodings and these mapping
  54. #   tables, see the file "README.TXT".
  55. #
  56. # Format:
  57. # -------
  58. #
  59. #   Three tab-separated columns;
  60. #   '#' begins a comment which continues to the end of the line.
  61. #     Column #1 is the Mac OS Romanian code (in hex as 0xNN)
  62. #     Column #2 is the corresponding Unicode or Unicode sequence
  63. #       (in hex as 0xNNNN or 0xNNNN+0xNNNN).
  64. #     Column #3 is a comment containing the Unicode name
  65. #
  66. #   The entries are in Mac OS Romanian code order.
  67. #
  68. #   One of these mappings requires the use of a corporate character.
  69. #   See the file "CORPCHAR.TXT" and notes below.
  70. #
  71. #   Control character mappings are not shown in this table, following
  72. #   the conventions of the standard UTC mapping tables. However, the
  73. #   Mac OS Roman character set uses the standard control characters at
  74. #   0x00-0x1F and 0x7F.
  75. #
  76. # Notes on Mac OS Romanian:
  77. # -------------------------
  78. #
  79. #    Mac OS Romanian is used only for Romanian.
  80. #
  81. #   The Mac OS Romanian encoding shares the script code smRoman
  82. #   (0) with the standard Mac OS Roman encoding. To determine if
  83. #   the Romanian encoding is being used, you must also check if the
  84. #   system region code is 39, verRomania.
  85. #
  86. #   This character set is a variant of standard Mac OS Roman, adding
  87. #   upper and lower A breve, S comma below, and T comma below. It
  88. #   has 6 code point differences from standard Mac OS Roman.
  89. #
  90. #   Before Mac OS 8.5, code point 0xDB was CURRENCY SIGN, and was
  91. #   mapped to U+00A4. In Mac OS 8.5 and later versions, code point
  92. #   0xDB is changed to EURO SIGN and maps to U+20AC; the standard
  93. #   Apple fonts are updated for Mac OS 8.5 to reflect this. There is
  94. #   a "currency sign" variant of the Mac OS Romanian encoding that
  95. #   still maps 0xDB to U+00A4; this can be used for older fonts.
  96. #   Note: U+20AC is new with Unicode 2.1; for earlier Unicode
  97. #   versions, Mac OS Romanian 0xDB may be mapped to private-use
  98. #   character U+F8A0.
  99. #
  100. # Unicode mapping issues and notes:
  101. # ---------------------------------
  102. #
  103. #   In four cases, we have mapped a single Mac OS Romanian character
  104. #   to a sequence of two Unicode characters. For example, the Mac OS
  105. #   Romanian character at 0xAF (S with comma below) is mapped to
  106. #   0x0053+0x0326, LATIN CAPITAL LETTER S + COMBINING COMMA BELOW,
  107. #   instead of to the single Unicode character 0x015E, LATIN CAPITAL
  108. #   LETTER S WITH CEDILLA. Although the latter is supposed to be
  109. #   equivalent to the form using comma, the COMBINING COMMA BELOW is
  110. #   not unified with the COMBINING CEDILLA. Unicode is planning to
  111. #   add a composed form with comma below, whose decomposition would
  112. #   presumably use COMBINING COMMA BELOW. We need to make sure that
  113. #   the mappings in these tables are equivalent to their
  114. #   decomposition, which could have been a problem using the
  115. #   composed forms with cedilla, so here we use the decomposition
  116. #   with comma below.
  117. #
  118. #   The following corporate zone Unicode character is used in this
  119. #   mapping:
  120. #
  121. #     0xF8FF  Apple logo
  122. #
  123. #   NOTE: The graphic image associated with the Apple logo character
  124. #   is not authorized for use without permission of Apple, and
  125. #   unauthorized use might constitute trademark infringement.
  126. #
  127. # Details of mapping changes in each version:
  128. # -------------------------------------------
  129. #
  130. #   Changes from version n05 to version b02:
  131. #
  132. #   - Encoding changed for Mac OS 8.5; change mapping of 0xDB from
  133. #   CURRENCY SIGN (U+00A4) to EURO SIGN (U+20AC).
  134. #
  135. #   Changes from version n02 to version n03:
  136. #
  137. #   - Change mapping of 0xBD from U+2126 to its canonical
  138. #     decomposition, U+03A9.
  139. #   - Change mapping of 0xAF,0xBF,0xDE,0xDF from composed S or T
  140. #     WITH CEDILLA to S or T with COMBINING COMMA BELOW (to match
  141. #     our decomposition mappings).
  142. #
  143. ##################
  144.  
  145. 0x20    0x0020    # SPACE
  146. 0x21    0x0021    # EXCLAMATION MARK
  147. 0x22    0x0022    # QUOTATION MARK
  148. 0x23    0x0023    # NUMBER SIGN
  149. 0x24    0x0024    # DOLLAR SIGN
  150. 0x25    0x0025    # PERCENT SIGN
  151. 0x26    0x0026    # AMPERSAND
  152. 0x27    0x0027    # APOSTROPHE
  153. 0x28    0x0028    # LEFT PARENTHESIS
  154. 0x29    0x0029    # RIGHT PARENTHESIS
  155. 0x2A    0x002A    # ASTERISK
  156. 0x2B    0x002B    # PLUS SIGN
  157. 0x2C    0x002C    # COMMA
  158. 0x2D    0x002D    # HYPHEN-MINUS
  159. 0x2E    0x002E    # FULL STOP
  160. 0x2F    0x002F    # SOLIDUS
  161. 0x30    0x0030    # DIGIT ZERO
  162. 0x31    0x0031    # DIGIT ONE
  163. 0x32    0x0032    # DIGIT TWO
  164. 0x33    0x0033    # DIGIT THREE
  165. 0x34    0x0034    # DIGIT FOUR
  166. 0x35    0x0035    # DIGIT FIVE
  167. 0x36    0x0036    # DIGIT SIX
  168. 0x37    0x0037    # DIGIT SEVEN
  169. 0x38    0x0038    # DIGIT EIGHT
  170. 0x39    0x0039    # DIGIT NINE
  171. 0x3A    0x003A    # COLON
  172. 0x3B    0x003B    # SEMICOLON
  173. 0x3C    0x003C    # LESS-THAN SIGN
  174. 0x3D    0x003D    # EQUALS SIGN
  175. 0x3E    0x003E    # GREATER-THAN SIGN
  176. 0x3F    0x003F    # QUESTION MARK
  177. 0x40    0x0040    # COMMERCIAL AT
  178. 0x41    0x0041    # LATIN CAPITAL LETTER A
  179. 0x42    0x0042    # LATIN CAPITAL LETTER B
  180. 0x43    0x0043    # LATIN CAPITAL LETTER C
  181. 0x44    0x0044    # LATIN CAPITAL LETTER D
  182. 0x45    0x0045    # LATIN CAPITAL LETTER E
  183. 0x46    0x0046    # LATIN CAPITAL LETTER F
  184. 0x47    0x0047    # LATIN CAPITAL LETTER G
  185. 0x48    0x0048    # LATIN CAPITAL LETTER H
  186. 0x49    0x0049    # LATIN CAPITAL LETTER I
  187. 0x4A    0x004A    # LATIN CAPITAL LETTER J
  188. 0x4B    0x004B    # LATIN CAPITAL LETTER K
  189. 0x4C    0x004C    # LATIN CAPITAL LETTER L
  190. 0x4D    0x004D    # LATIN CAPITAL LETTER M
  191. 0x4E    0x004E    # LATIN CAPITAL LETTER N
  192. 0x4F    0x004F    # LATIN CAPITAL LETTER O
  193. 0x50    0x0050    # LATIN CAPITAL LETTER P
  194. 0x51    0x0051    # LATIN CAPITAL LETTER Q
  195. 0x52    0x0052    # LATIN CAPITAL LETTER R
  196. 0x53    0x0053    # LATIN CAPITAL LETTER S
  197. 0x54    0x0054    # LATIN CAPITAL LETTER T
  198. 0x55    0x0055    # LATIN CAPITAL LETTER U
  199. 0x56    0x0056    # LATIN CAPITAL LETTER V
  200. 0x57    0x0057    # LATIN CAPITAL LETTER W
  201. 0x58    0x0058    # LATIN CAPITAL LETTER X
  202. 0x59    0x0059    # LATIN CAPITAL LETTER Y
  203. 0x5A    0x005A    # LATIN CAPITAL LETTER Z
  204. 0x5B    0x005B    # LEFT SQUARE BRACKET
  205. 0x5C    0x005C    # REVERSE SOLIDUS
  206. 0x5D    0x005D    # RIGHT SQUARE BRACKET
  207. 0x5E    0x005E    # CIRCUMFLEX ACCENT
  208. 0x5F    0x005F    # LOW LINE
  209. 0x60    0x0060    # GRAVE ACCENT
  210. 0x61    0x0061    # LATIN SMALL LETTER A
  211. 0x62    0x0062    # LATIN SMALL LETTER B
  212. 0x63    0x0063    # LATIN SMALL LETTER C
  213. 0x64    0x0064    # LATIN SMALL LETTER D
  214. 0x65    0x0065    # LATIN SMALL LETTER E
  215. 0x66    0x0066    # LATIN SMALL LETTER F
  216. 0x67    0x0067    # LATIN SMALL LETTER G
  217. 0x68    0x0068    # LATIN SMALL LETTER H
  218. 0x69    0x0069    # LATIN SMALL LETTER I
  219. 0x6A    0x006A    # LATIN SMALL LETTER J
  220. 0x6B    0x006B    # LATIN SMALL LETTER K
  221. 0x6C    0x006C    # LATIN SMALL LETTER L
  222. 0x6D    0x006D    # LATIN SMALL LETTER M
  223. 0x6E    0x006E    # LATIN SMALL LETTER N
  224. 0x6F    0x006F    # LATIN SMALL LETTER O
  225. 0x70    0x0070    # LATIN SMALL LETTER P
  226. 0x71    0x0071    # LATIN SMALL LETTER Q
  227. 0x72    0x0072    # LATIN SMALL LETTER R
  228. 0x73    0x0073    # LATIN SMALL LETTER S
  229. 0x74    0x0074    # LATIN SMALL LETTER T
  230. 0x75    0x0075    # LATIN SMALL LETTER U
  231. 0x76    0x0076    # LATIN SMALL LETTER V
  232. 0x77    0x0077    # LATIN SMALL LETTER W
  233. 0x78    0x0078    # LATIN SMALL LETTER X
  234. 0x79    0x0079    # LATIN SMALL LETTER Y
  235. 0x7A    0x007A    # LATIN SMALL LETTER Z
  236. 0x7B    0x007B    # LEFT CURLY BRACKET
  237. 0x7C    0x007C    # VERTICAL LINE
  238. 0x7D    0x007D    # RIGHT CURLY BRACKET
  239. 0x7E    0x007E    # TILDE
  240. #
  241. 0x80    0x00C4    # LATIN CAPITAL LETTER A WITH DIAERESIS
  242. 0x81    0x00C5    # LATIN CAPITAL LETTER A WITH RING ABOVE
  243. 0x82    0x00C7    # LATIN CAPITAL LETTER C WITH CEDILLA
  244. 0x83    0x00C9    # LATIN CAPITAL LETTER E WITH ACUTE
  245. 0x84    0x00D1    # LATIN CAPITAL LETTER N WITH TILDE
  246. 0x85    0x00D6    # LATIN CAPITAL LETTER O WITH DIAERESIS
  247. 0x86    0x00DC    # LATIN CAPITAL LETTER U WITH DIAERESIS
  248. 0x87    0x00E1    # LATIN SMALL LETTER A WITH ACUTE
  249. 0x88    0x00E0    # LATIN SMALL LETTER A WITH GRAVE
  250. 0x89    0x00E2    # LATIN SMALL LETTER A WITH CIRCUMFLEX
  251. 0x8A    0x00E4    # LATIN SMALL LETTER A WITH DIAERESIS
  252. 0x8B    0x00E3    # LATIN SMALL LETTER A WITH TILDE
  253. 0x8C    0x00E5    # LATIN SMALL LETTER A WITH RING ABOVE
  254. 0x8D    0x00E7    # LATIN SMALL LETTER C WITH CEDILLA
  255. 0x8E    0x00E9    # LATIN SMALL LETTER E WITH ACUTE
  256. 0x8F    0x00E8    # LATIN SMALL LETTER E WITH GRAVE
  257. 0x90    0x00EA    # LATIN SMALL LETTER E WITH CIRCUMFLEX
  258. 0x91    0x00EB    # LATIN SMALL LETTER E WITH DIAERESIS
  259. 0x92    0x00ED    # LATIN SMALL LETTER I WITH ACUTE
  260. 0x93    0x00EC    # LATIN SMALL LETTER I WITH GRAVE
  261. 0x94    0x00EE    # LATIN SMALL LETTER I WITH CIRCUMFLEX
  262. 0x95    0x00EF    # LATIN SMALL LETTER I WITH DIAERESIS
  263. 0x96    0x00F1    # LATIN SMALL LETTER N WITH TILDE
  264. 0x97    0x00F3    # LATIN SMALL LETTER O WITH ACUTE
  265. 0x98    0x00F2    # LATIN SMALL LETTER O WITH GRAVE
  266. 0x99    0x00F4    # LATIN SMALL LETTER O WITH CIRCUMFLEX
  267. 0x9A    0x00F6    # LATIN SMALL LETTER O WITH DIAERESIS
  268. 0x9B    0x00F5    # LATIN SMALL LETTER O WITH TILDE
  269. 0x9C    0x00FA    # LATIN SMALL LETTER U WITH ACUTE
  270. 0x9D    0x00F9    # LATIN SMALL LETTER U WITH GRAVE
  271. 0x9E    0x00FB    # LATIN SMALL LETTER U WITH CIRCUMFLEX
  272. 0x9F    0x00FC    # LATIN SMALL LETTER U WITH DIAERESIS
  273. 0xA0    0x2020    # DAGGER
  274. 0xA1    0x00B0    # DEGREE SIGN
  275. 0xA2    0x00A2    # CENT SIGN
  276. 0xA3    0x00A3    # POUND SIGN
  277. 0xA4    0x00A7    # SECTION SIGN
  278. 0xA5    0x2022    # BULLET
  279. 0xA6    0x00B6    # PILCROW SIGN
  280. 0xA7    0x00DF    # LATIN SMALL LETTER SHARP S
  281. 0xA8    0x00AE    # REGISTERED SIGN
  282. 0xA9    0x00A9    # COPYRIGHT SIGN
  283. 0xAA    0x2122    # TRADE MARK SIGN
  284. 0xAB    0x00B4    # ACUTE ACCENT
  285. 0xAC    0x00A8    # DIAERESIS
  286. 0xAD    0x2260    # NOT EQUAL TO
  287. 0xAE    0x0102    # LATIN CAPITAL LETTER A WITH BREVE
  288. 0xAF    0x0053+0x0326    # LATIN CAPITAL LETTER S + COMBINING COMMA BELOW
  289. 0xB0    0x221E    # INFINITY
  290. 0xB1    0x00B1    # PLUS-MINUS SIGN
  291. 0xB2    0x2264    # LESS-THAN OR EQUAL TO
  292. 0xB3    0x2265    # GREATER-THAN OR EQUAL TO
  293. 0xB4    0x00A5    # YEN SIGN
  294. 0xB5    0x00B5    # MICRO SIGN
  295. 0xB6    0x2202    # PARTIAL DIFFERENTIAL
  296. 0xB7    0x2211    # N-ARY SUMMATION
  297. 0xB8    0x220F    # N-ARY PRODUCT
  298. 0xB9    0x03C0    # GREEK SMALL LETTER PI
  299. 0xBA    0x222B    # INTEGRAL
  300. 0xBB    0x00AA    # FEMININE ORDINAL INDICATOR
  301. 0xBC    0x00BA    # MASCULINE ORDINAL INDICATOR
  302. 0xBD    0x03A9    # GREEK CAPITAL LETTER OMEGA
  303. 0xBE    0x0103    # LATIN SMALL LETTER A WITH BREVE
  304. 0xBF    0x0073+0x0326    # LATIN SMALL LETTER S + COMBINING COMMA BELOW
  305. 0xC0    0x00BF    # INVERTED QUESTION MARK
  306. 0xC1    0x00A1    # INVERTED EXCLAMATION MARK
  307. 0xC2    0x00AC    # NOT SIGN
  308. 0xC3    0x221A    # SQUARE ROOT
  309. 0xC4    0x0192    # LATIN SMALL LETTER F WITH HOOK
  310. 0xC5    0x2248    # ALMOST EQUAL TO
  311. 0xC6    0x2206    # INCREMENT
  312. 0xC7    0x00AB    # LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
  313. 0xC8    0x00BB    # RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
  314. 0xC9    0x2026    # HORIZONTAL ELLIPSIS
  315. 0xCA    0x00A0    # NO-BREAK SPACE
  316. 0xCB    0x00C0    # LATIN CAPITAL LETTER A WITH GRAVE
  317. 0xCC    0x00C3    # LATIN CAPITAL LETTER A WITH TILDE
  318. 0xCD    0x00D5    # LATIN CAPITAL LETTER O WITH TILDE
  319. 0xCE    0x0152    # LATIN CAPITAL LIGATURE OE
  320. 0xCF    0x0153    # LATIN SMALL LIGATURE OE
  321. 0xD0    0x2013    # EN DASH
  322. 0xD1    0x2014    # EM DASH
  323. 0xD2    0x201C    # LEFT DOUBLE QUOTATION MARK
  324. 0xD3    0x201D    # RIGHT DOUBLE QUOTATION MARK
  325. 0xD4    0x2018    # LEFT SINGLE QUOTATION MARK
  326. 0xD5    0x2019    # RIGHT SINGLE QUOTATION MARK
  327. 0xD6    0x00F7    # DIVISION SIGN
  328. 0xD7    0x25CA    # LOZENGE
  329. 0xD8    0x00FF    # LATIN SMALL LETTER Y WITH DIAERESIS
  330. 0xD9    0x0178    # LATIN CAPITAL LETTER Y WITH DIAERESIS
  331. 0xDA    0x2044    # FRACTION SLASH
  332. 0xDB    0x20AC    # EURO SIGN
  333. 0xDC    0x2039    # SINGLE LEFT-POINTING ANGLE QUOTATION MARK
  334. 0xDD    0x203A    # SINGLE RIGHT-POINTING ANGLE QUOTATION MARK
  335. 0xDE    0x0054+0x0326    # LATIN CAPITAL LETTER T + COMBINING COMMA BELOW
  336. 0xDF    0x0074+0x0326    # LATIN SMALL LETTER T + COMBINING COMMA BELOW
  337. 0xE0    0x2021    # DOUBLE DAGGER
  338. 0xE1    0x00B7    # MIDDLE DOT
  339. 0xE2    0x201A    # SINGLE LOW-9 QUOTATION MARK
  340. 0xE3    0x201E    # DOUBLE LOW-9 QUOTATION MARK
  341. 0xE4    0x2030    # PER MILLE SIGN
  342. 0xE5    0x00C2    # LATIN CAPITAL LETTER A WITH CIRCUMFLEX
  343. 0xE6    0x00CA    # LATIN CAPITAL LETTER E WITH CIRCUMFLEX
  344. 0xE7    0x00C1    # LATIN CAPITAL LETTER A WITH ACUTE
  345. 0xE8    0x00CB    # LATIN CAPITAL LETTER E WITH DIAERESIS
  346. 0xE9    0x00C8    # LATIN CAPITAL LETTER E WITH GRAVE
  347. 0xEA    0x00CD    # LATIN CAPITAL LETTER I WITH ACUTE
  348. 0xEB    0x00CE    # LATIN CAPITAL LETTER I WITH CIRCUMFLEX
  349. 0xEC    0x00CF    # LATIN CAPITAL LETTER I WITH DIAERESIS
  350. 0xED    0x00CC    # LATIN CAPITAL LETTER I WITH GRAVE
  351. 0xEE    0x00D3    # LATIN CAPITAL LETTER O WITH ACUTE
  352. 0xEF    0x00D4    # LATIN CAPITAL LETTER O WITH CIRCUMFLEX
  353. 0xF0    0xF8FF    # Apple logo
  354. 0xF1    0x00D2    # LATIN CAPITAL LETTER O WITH GRAVE
  355. 0xF2    0x00DA    # LATIN CAPITAL LETTER U WITH ACUTE
  356. 0xF3    0x00DB    # LATIN CAPITAL LETTER U WITH CIRCUMFLEX
  357. 0xF4    0x00D9    # LATIN CAPITAL LETTER U WITH GRAVE
  358. 0xF5    0x0131    # LATIN SMALL LETTER DOTLESS I
  359. 0xF6    0x02C6    # MODIFIER LETTER CIRCUMFLEX ACCENT
  360. 0xF7    0x02DC    # SMALL TILDE
  361. 0xF8    0x00AF    # MACRON
  362. 0xF9    0x02D8    # BREVE
  363. 0xFA    0x02D9    # DOT ABOVE
  364. 0xFB    0x02DA    # RING ABOVE
  365. 0xFC    0x00B8    # CEDILLA
  366. 0xFD    0x02DD    # DOUBLE ACUTE ACCENT
  367. 0xFE    0x02DB    # OGONEK
  368. 0xFF    0x02C7    # CARON
  369.